ICU Normalizer
Elasticsearch
の
ICU Analysis Plugin
に含まれる
normalizer
https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-icu-normalization-charfilter.html
unicode
をいい感じに
正規化
してくれる
NFDで濁音と半濁音が分離する現象
など
char_filter
なので、tokenizerとか関係なくいきなり置換だけやってくれる
つまりngram等の他のtokenizerと一緒に使える